01-12-2019

O mnie

Literatura

  • Wilkinson, L. (2005). The Grammar of Graphics (New York: Springer-Verlag).
  • Biecek, P. (2016). Zbiór esejów o sztuce prezentowania danych Odkrywać! Ujawniać! Objaśniać!” (Warszawa: Wydawnictwa Uniwersytetu Warszawskiego.

Plan spotkań

  1. Gramatyka grafiki.
  2. Błędy w wizualizacjach danych.
  3. Efektywne projektowanie dashboardów.
  4. Zaaawansowane wizualizacje danych.

Historia wizualizacji danych

Florence Nightingale

Standardy

Joint Committee on Standards for Graphic Presentation (1915). Standards for Graphic Presentation. Publications of the American Statistical Association 14, 790–797.

Gramatyka grafiki

Gramatyka grafiki

Gramatyka grafiki (grammar of graphics): ustrukturyzowany opis wizualizacji danych.

Wilkinson, L. (2005). The Grammar of Graphics (New York: Springer-Verlag).

Gramatyka grafiki

Atrybuty wizualne

Atrybuty wizualne (aesthetics): mapowanie danych do osi, kolorów, kształtów.

Atrybuty wizualne

Oś X: Sepal.Length. Oś Y: Petal.Length.

Atrybuty wizualne

Oś X: Sepal.Length. Oś Y: Petal.Length. Kolor: Species.

Atrybuty wizualne

Oś X: Sepal.Length. Oś Y: Petal.Length. Kształt: Species.

Atrybuty wizualne

Oś X: Sepal.Length. Oś Y: Petal.Length. Kształt: Species. Kolor: Species.

Geometrie

Geometrie: obiekty reprezentujące dane.

Geometrie

Geometrie

Orientacja obiektów geometrycznych wzgledem siebie też jest istotna.

Geometrie

Fasety

Dzielenie wykresu na podwykresy w zależności od poziomu zmiennej dyskretnej.

Fasety

Statystyki

Transformacje danych w celu przypisania ich do atrybutów wizualnych.

Statystyki

Statystyki

Statystyki

Statystyki

Statystyki

Koordynaty

Koordynaty

Koordynaty

Motyw

Motyw

Motyw

Motyw

Motyw

Gramatyka grafiki

Nazwa Przykłady
Dane (data)
Atrybuty wizualne (aesthetics) Osie, kolory, kształty, typy linii
Geometrie (geometries) Linie, słupki, punkty
Fasety (facets) Podrysunki tworzone na podstawie dyskretnych zmiennych
Statystyki (statistics) Średnie, mediany, kwantyle.
Koordynaty (coordinates) Kartezjański, polarny
Motyw (theme) Wygląd rysunku

Przykłady

  • cut: cięcie
  • clarity: czystość
  • color: kolor
  • carat: waga (w karatach)
  • price: cena (USD)

Przykłady

Przykłady

Przykłady

Przykłady

Przykłady

Przykłady

Błędy w wizualizacjach

Rodzaje wizualizacji

Wizualizacja statyczna

3D

Infografiki

Wizualizacje interaktywne

Dashboardy

Stylizowanie wizualizacji

  1. Czcionki.
  2. Kolory.
  3. Dodatkowe elementy graficzne.
  4. Układ treści.

Czcionki

  1. Czcionka do tytułów/nagłówków.
  2. Treść dokumentu.
  3. Wyróżnianie treści.

Czcionki

Czcionki

Czcionki wykorzystywane przez Tableau są tak dobrane, aby zapewnić maksymalną czytelność przy małych rozmiarach.

Kolory

Kolory

Kolory mogą nawiązywać do treści wizualizacji…

Kolory

… ale schemat kolorystyczny powinien być stosowany konsekwentnie.

Kolory

Kolory

Kolory

Widzenie barwne

Kolory

Tableau domyślnie dobiera palety kolorów (zarówno ilościowe jak i kategoryczne), które są łatwo rozróżnialne również dla osób z zaburzeniami widzenia barwnego.

Grafiki

Elementy graficzne nawiązujące do treści wzmacniają przekaz i pozwalają lepiej zrozumieć dane.

Grafiki

Prostota

Dashboard może zawierać tylko jeden wykres, co nie przekłada się na łatwość jej zrozumienia.

Prostota

Złe wizualizacje

Trudne porównania - niewłaściwie wybrana metoda wizualizacja.

Złe wizualizacje

Niewłaściwie wybrana metoda wizualizacji.

Złe wizualizacje

Zbyt duża ilość informacji na jednym wykresie.

Wizualizacje i prawda

How to Lie with Statistics, Darrell Huff

Korelacje i współwystępowanie

Trzeci wymiar

Wykresy kołowe

Wykresy kołowe

Ucięte osie

Ucięte osie

Przykłady

Przykłady

Przykłady

Przykłady

Przykłady

Przykłady

Narzędzia do wizualizacji

Narzędzia

  1. Programistyczne (R, Python, JavaScript)
  2. Programy graficzne (Inkscape).
  3. Programy dedykowane do wizualizacji danych (Tableau).

Języki wizualizacji danych

Podział narzędzi do wizualizacji danych

Deklaratywne:

  • zadanie: warunki jakie musi spełniać wizualizacja,
  • jak wizualizacja jest wykonywana jest rozstrzygane wewnętrznie i niezależnie od użytkownika,
  • oddzielenie specyfikacji od wykonania.

Imperatywne:

  • zadanie: krok po kroku jak stworzyć wizualizację,
  • użytkownik w pełni kontroluje każdy detal wizualizacji,
  • jeśli warunki jakie musi spełniać wizualizacja zmienią się nawet odrobinę, instrukcja tworzenia może się zmienić znacząco.

Altair (Python)

Altair (Python)

Pythonowe API dla Vega-Lite.

Brian Granger, uzasadniając stworzenie Altaira: I love Python, but do my visualisations using R/ggplot2.

Altair (Python)

bokeh (Python)

bokeh (Python)

  • Python jako API do BokehJS,
  • praca głownie w Pythonie, JSowy silnik mało dostępny i źle udokumentowany,
  • całe dashboardy.

bokeh (R)

Leaflet

Leaflet

matplotlib (Python)

matplotlib (Python)

  • trudne zarządzanie czasem na osiach,
  • niesatysfakcjonujące mapowanie do kształtów.

Rozszerzenia: https://mpld3.github.io/

plot.ly

seaborn

Vega-Lite

Vega

Programy graficzne